哈科学家发明哈萨克语语音识别系统 引来飞利浦谈合作
1305457
确诊病例
1704
现有病例
10
单日新增
89
单日康复
据Khabar24 电视频道报道,哈萨克斯坦科学家奥肯·马米尔巴耶夫开发了一种哈萨克语语音识别系统,可将该语言的语音信息转换为文本文字。
该项目是在2018-2020 年财政支持的框架内实施的,项目主题为“基于深度神经网络的多语言语音自动识别技术”。2021年,奥肯·马米尔巴耶夫和他的团队获得了另一个 IT 项目的资助,用于开发一个自动搜索和分析非法网络内容的系统。
奥肯·马米尔巴耶夫
在读博士期间,奥肯·马米尔巴耶夫就萌生了发明一项有用服务的想法,并在语言学家的帮助下建立了语言基础。哈萨克语语音识别系统的原理非常简单:人工智能读取声音,然后将其转换为文本文字。
“创建系统时,遇到的最大问题就是语音数据语料库的开发。如果我们能收集到更多的数据,那么我们的识别模型就被训练出来了,可以识别所有单词。如果语料库很小,有些单词它就无法识别。我们现已获得两千小时的语音记录,进行系统测试时,单词识别的准确率为 8%。如果我们的语音记录达到五千小时左右,那么准确率可以达到90%,”奥肯·马米尔巴耶夫说。
现在,该系统被应用于Telegram 社交网络中的聊天机器人。要对其进行测试,只需按住录制语音消息按钮即可。之后,机器人会自动将语音转换为文字。
为方便起见,开发人员还开发了一个可用于商务会议的录音笔;完成录制后,系统可将其形成哈萨克语文本。飞利浦国际公司已经对这一发明产生了兴趣,并计划将该系统应用到其面向哈萨克斯坦市场的产品之一。
带有语音识别功能的飞利浦 Smart Mike Duo录音笔将被引入哈萨克斯坦市场,该麦克风会自动将语音转换为文字。该设备能够识别同时发出的两种不同的声音,并在两个不同的通道上自动将语音转换为文本。
奥肯·马米尔巴耶夫介绍说:“飞利浦提出合作并进一步推广该产品。将软件加载到计算机中,然后与录音笔连接。会自动识别两种不同的声音,并以两个块显示哈萨克语文本。这种录音笔在开会时很有用,可以文本形式保存会议信息”。
期回顾
托卡耶夫谈修宪:独立的哈萨克斯坦将掀开历史新篇章
俄乌局势持续升级 哈国防部长承诺人民可以睡安稳觉